#Janeiro 2019
planilha <- read_delim("planilha_201901.csv",
delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 623580 Columns: 23
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (22): data_base, uf, tcb, sr, cliente, ocupacao, cnae_secao, cnae_subcla...
## num (1): carteira_ativa
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
head(planilha)
## # A tibble: 6 × 23
## data_…¹ uf tcb sr cliente ocupa…² cnae_…³ cnae_…⁴ porte modal…⁵ origem
## <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 31/01/… AC Banc… S1 PF PF - A… - - PF -… PF - C… Sem d…
## 2 31/01/… AC Banc… S1 PF PF - A… - - PF -… PF - C… Sem d…
## 3 31/01/… AC Banc… S1 PF PF - A… - - PF -… PF - E… Sem d…
## 4 31/01/… AC Banc… S1 PF PF - A… - - PF -… PF - E… Sem d…
## 5 31/01/… AC Banc… S1 PF PF - A… - - PF -… PF - E… Sem d…
## 6 31/01/… AC Banc… S1 PF PF - A… - - PF -… PF - E… Sem d…
## # … with 12 more variables: indexador <chr>, numero_de_operacoes <chr>,
## # a_vencer_ate_90_dias <chr>, a_vencer_de_91_ate_360_dias <chr>,
## # a_vencer_de_361_ate_1080_dias <chr>, a_vencer_de_1081_ate_1800_dias <chr>,
## # a_vencer_de_1801_ate_5400_dias <chr>, a_vencer_acima_de_5400_dias <chr>,
## # vencido_acima_de_15_dias <chr>, carteira_ativa <dbl>,
## # carteira_inadimplida_arrastada <chr>, ativo_problematico <chr>, and
## # abbreviated variable names ¹data_base, ²ocupacao, ³cnae_secao, …
attach(planilha)
#Substituindo os valores "<=15" da coluna numero_de_operacoes para 15
planilha$numero_de_operacoes <- trimws(planilha$numero_de_operacoes, "both")
planilha$numero_de_operacoes[planilha$numero_de_operacoes == "<= 15"] <- 15
#convertendo para numérico a coluna numero_de_operacoes
planilha$numero_de_operacoes <- as.numeric(planilha$numero_de_operacoes)
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "uf"
medias_uf <- aggregate(numero_de_operacoes ~ uf, planilha, mean, na.rm = TRUE)
plot_ly(medias_uf, x = ~uf, y = ~numero_de_operacoes, type = "bar") %>%
layout(title = "Média de número de operações por UF", margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "tcb"
medias_tcb <- aggregate(numero_de_operacoes ~ tcb, planilha, mean, na.rm = TRUE)
plot_ly(medias_tcb, x = ~tcb, y = ~numero_de_operacoes, type = "bar") %>%
layout(title = "Média de número de operações por TCB", xaxis = list(title = "TCB"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "ocupacao"
medias_ocupacao <- aggregate(numero_de_operacoes ~ ocupacao, planilha, mean, na.rm = TRUE)
plot_ly(medias_ocupacao, x = ~ocupacao, y = ~numero_de_operacoes, type = "bar") %>%
layout(title = "Média de número de operações por ocupação", margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "cnae_secao"
medias_cnae_secao <- aggregate(numero_de_operacoes ~ cnae_secao, planilha, mean, na.rm = TRUE)
plot_ly(medias_cnae_secao, x = ~cnae_secao, y = ~numero_de_operacoes, type = "bar") %>%
layout(title = "Média de número de operações por CNAE seção", xaxis = list(title = "CNAE seção"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "cnae_subclasse"
medias_cnae_subclasse <- aggregate(numero_de_operacoes ~ cnae_subclasse, planilha, mean, na.rm = TRUE)
plot_ly(medias_cnae_subclasse, x = ~cnae_subclasse, y = ~numero_de_operacoes, type = "bar") %>%
layout(title = "Média de número de operações por CNAE subclasse", xaxis = list(title = "CNAE subclasse"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "porte"
medias_porte <- aggregate(numero_de_operacoes ~ porte, planilha, mean, na.rm = TRUE)
plot_ly(medias_porte, x = ~porte, y = ~numero_de_operacoes, type = "bar") %>%
layout(title = "Média de número de operações por porte", xaxis = list(title = "Porte"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "modalidade"
medias_modalidade <- aggregate(numero_de_operacoes ~ modalidade, planilha, mean, na.rm = TRUE)
plot_ly(medias_modalidade, x = ~modalidade, y = ~numero_de_operacoes, type = "bar") %>%
layout(title = "Média de número de operações por modalidade", xaxis = list(title = "Modalidade"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Cria um gráfico de barras interativo com as médias de "numero_de_operacoes" para cada valor único da coluna "indexador"
medias_indexador <- aggregate(numero_de_operacoes ~ indexador, planilha, mean, na.rm = TRUE)
plot_ly(medias_indexador, x = ~indexador, y = ~numero_de_operacoes, type = "bar") %>%
layout(title = "Média de número de operações por indexador", xaxis = list(title = "Indexador"), yaxis = list(title = "Média de número de operações"), margin = list(b = 150))
# Template para a leitura dos arquivos csv para o banco geral
Ano1 <- c(paste0(2019,0,1:9),paste0(2019,10:12))
Ano2 <- c(paste0(2020,0,1:9),paste0(2020,10:12))
Ano3 <- c(paste0(2021,0,1:9),paste0(2021,10:12))
Ano4 <- c(paste0(2022,0,1:9),paste0(2022,10:12))
BancoGeral <-c(Ano1, Ano2, Ano3, Ano4)
# Criação de matrizes vazias com dimensão lenght(BancoGeral) x 27(número de estados))
matriz_medias_uf_operacoes <- matrix(NA, nrow = length(BancoGeral), ncol = 27,
dimnames = list(BancoGeral, NULL))
# Loop for com interações por uf
for (j in 1:length(BancoGeral)) {
End <- paste0("planilha_", BancoGeral[j], ".csv")
planilha <- read_delim(End, delim = ";", escape_double = FALSE, trim_ws = TRUE, show_col_types = FALSE)
# Substituindo os valores "<=15" da coluna numero_de_operacoes para 15
planilha$numero_de_operacoes <- trimws(planilha$numero_de_operacoes, "both")
planilha$numero_de_operacoes[planilha$numero_de_operacoes == "<= 15"] <- 15
# Convertendo para numérico a coluna numero_de_operacoes
planilha$numero_de_operacoes <- as.numeric(planilha$numero_de_operacoes)
# Calculando a média da coluna numero_de_operacoes por uf
media_uf_operacoes <- tapply(planilha$numero_de_operacoes, planilha$uf, mean)
# Armazenando as médias na matriz de médias de operações por uf
matriz_medias_uf_operacoes[j, ] <- sapply(unique(planilha$uf), function(estado) {
replace(media_uf_operacoes[estado], is.na(media_uf_operacoes[estado]), 0)})
}
# Atribuindo os nomes dos estados às colunas da matriz
colnames(matriz_medias_uf_operacoes) <- unique(planilha$uf)
# Criar objeto ts
matriz_medias_uf_operacoes_ts <- ts(matriz_medias_uf_operacoes, start = c(2019, 1), frequency = 12)
# Definir rótulos das linhas
dimnames(matriz_medias_uf_operacoes_ts)[[1]] <- BancoGeral
# Autoplot
autoplot(matriz_medias_uf_operacoes_ts)

# Estatística descritiva básica
stat.desc(matriz_medias_uf_operacoes_ts)
## AC AL AM AP
## nbr.val 48.0000000 48.000000 48.00000000 48.00000000
## nbr.null 0.0000000 0.000000 0.00000000 0.00000000
## nbr.na 0.0000000 0.000000 0.00000000 0.00000000
## min 165.5928537 502.285356 346.83220876 180.98481522
## max 194.1553306 588.985872 439.00877785 224.45054612
## range 28.5624768 86.700515 92.17656909 43.46573090
## sum 8538.0441112 25979.752199 19015.12132457 9753.18183507
## median 179.7556737 545.579018 403.10222426 207.58883315
## mean 177.8759190 541.244837 396.14836093 203.19128823
## SE.mean 1.2524918 3.848600 3.71897155 1.73096247
## CI.mean.0.95 2.5196884 7.742385 7.48160573 3.48224732
## var 75.2993089 710.962787 663.87596910 143.81909083
## std.dev 8.6775174 26.663885 25.76579067 11.99245975
## coef.var 0.0487841 0.049264 0.06504076 0.05902054
## BA CE DF ES
## nbr.val 48.00000000 48.00000000 48.00000000 48.00000000
## nbr.null 0.00000000 0.00000000 0.00000000 0.00000000
## nbr.na 0.00000000 0.00000000 0.00000000 0.00000000
## min 801.88714690 690.70712571 404.22308130 268.86689338
## max 994.96755653 907.91830573 507.28238621 358.87963120
## range 193.08040963 217.21118002 103.05930491 90.01273782
## sum 42390.75950062 37853.87021502 21124.84514091 14793.65165536
## median 889.66669998 778.17106581 442.14245980 309.69449144
## mean 883.14082293 788.62229615 440.10094044 308.20107615
## SE.mean 8.15338294 7.14965633 3.64146559 2.99422014
## CI.mean.0.95 16.40249079 14.38325330 7.32568386 6.02359397
## var 3190.92736541 2453.64411012 636.49303980 430.33700528
## std.dev 56.48829406 49.53427208 25.22881368 20.74456568
## coef.var 0.06396295 0.06281115 0.05732506 0.06730854
## GO MA MG MS
## nbr.val 48.00000000 48.0000000 48.00000000 48.00000000
## nbr.null 0.00000000 0.0000000 0.00000000 0.00000000
## nbr.na 0.00000000 0.0000000 0.00000000 0.00000000
## min 351.94063646 537.7772266 696.47560203 250.43445952
## max 433.91530115 667.3256682 864.83591649 288.47288783
## range 81.97466470 129.5484416 168.36031445 38.03842831
## sum 18289.07537219 29126.2732869 36214.74537020 12944.71153620
## median 380.79997634 614.6289893 758.68905525 269.56259525
## mean 381.02240359 606.7973601 754.47386188 269.68149034
## SE.mean 3.16751588 5.6883743 6.10983124 1.67500319
## CI.mean.0.95 6.37222002 11.4435330 12.29139504 3.36967178
## var 481.59152791 1553.1648858 1791.84181379 134.67051333
## std.dev 21.94519373 39.4102130 42.33015254 11.60476253
## coef.var 0.05759555 0.0649479 0.05610553 0.04303136
## MT PA PB PE
## nbr.val 48.00000000 48.00000000 48.00000000 48.00000000
## nbr.null 0.00000000 0.00000000 0.00000000 0.00000000
## nbr.na 0.00000000 0.00000000 0.00000000 0.00000000
## min 207.34331091 459.72808419 501.62127014 719.38436864
## max 249.89487878 559.65093661 610.01593775 894.73904296
## range 42.55156787 99.92285243 108.39466762 175.35467432
## sum 10790.05781492 24534.18497286 26073.30985882 38556.24219462
## median 225.38056069 519.62185539 549.53995033 808.38546820
## mean 224.79287114 511.12885360 543.19395539 803.25504572
## SE.mean 1.81071246 4.75750140 4.11379309 6.63515399
## CI.mean.0.95 3.64268362 9.57085831 8.27588423 13.34820810
## var 157.37662162 1086.42333852 812.31809317 2113.21288838
## std.dev 12.54498392 32.96093655 28.50119459 45.96969533
## coef.var 0.05580686 0.06448655 0.05246965 0.05722926
## PI PR RJ RN
## nbr.val 48.00000000 48.00000000 48.00000000 48.00000000
## nbr.null 0.00000000 0.00000000 0.00000000 0.00000000
## nbr.na 0.00000000 0.00000000 0.00000000 0.00000000
## min 388.51421047 410.40889594 1088.12723879 481.15397862
## max 499.37980419 495.50882482 1305.19050345 560.55303948
## range 110.86559372 85.09992888 217.06326466 79.39906086
## sum 21437.67842887 21177.35517653 57844.21961228 24595.22098904
## median 453.22507342 441.45654129 1219.26121053 513.12379499
## mean 446.61830060 441.19489951 1205.08790859 512.40043727
## SE.mean 4.22190570 3.06816736 9.82768021 3.36230408
## CI.mean.0.95 8.49337874 6.17235659 19.77074242 6.76408334
## var 855.57541212 451.85524626 4635.99831422 542.64425921
## std.dev 29.25022072 21.25688703 68.08816574 23.29472600
## coef.var 0.06549266 0.04818026 0.05650058 0.04546196
## RO RR RS SC
## nbr.val 48.00000000 48.00000000 48.00000000 48.00000000
## nbr.null 0.00000000 0.00000000 0.00000000 0.00000000
## nbr.na 0.00000000 0.00000000 0.00000000 0.00000000
## min 167.04834144 161.04380390 449.90533639 276.36359992
## max 208.13440463 200.19515131 531.22713828 335.39996817
## range 41.08606319 39.15134740 81.32180189 59.03636825
## sum 8905.46802938 8494.65613610 23455.69026909 14171.48921946
## median 184.04208847 174.28056443 491.55527228 294.42246586
## mean 185.53058395 176.97200284 488.66021394 295.23935874
## SE.mean 1.73742882 1.62529213 3.25359197 1.88005000
## CI.mean.0.95 3.49525594 3.26966602 6.54538279 3.78217276
## var 144.89562695 126.79557571 508.12131504 169.66022482
## std.dev 12.03725994 11.26035416 22.54154642 13.02536851
## coef.var 0.06488019 0.06362788 0.04612929 0.04411799
## SE SP TO
## nbr.val 48.00000000 48.00000000 48.00000000
## nbr.null 0.00000000 0.00000000 0.00000000
## nbr.na 0.00000000 0.00000000 0.00000000
## min 372.27792916 1425.27915116 159.02930805
## max 448.47650048 1720.71734196 192.92095856
## range 76.19857132 295.43819080 33.89165051
## sum 19467.09808435 74211.32679033 8319.62012146
## median 412.33887687 1563.55841103 174.32520043
## mean 405.56454342 1546.06930813 173.32541920
## SE.mean 2.98934948 11.04266254 1.40058820
## CI.mean.0.95 6.01379546 22.21497161 2.81762003
## var 428.93809576 5853.13900797 94.15907075
## std.dev 20.71082074 76.50581029 9.70355969
## coef.var 0.05106665 0.04948408 0.05598463
# Convertendo para data frame
data_frame_uf_operacoes <- as.data.frame(matriz_medias_uf_operacoes)
# Adicionar coluna de período ao data frame
data_frame_uf_operacoes <- data_frame_uf_operacoes %>%
mutate(Periodo = rep(c("Periodo1", "Periodo2", "Periodo3"), each = 16))
# Realizar o teste de Kruskal-Wallis por períodos
kruskal_test_uf_operacoes <- kruskal.test(data_frame_uf_operacoes$RS ~ data_frame_uf_operacoes$Periodo)
# Imprimir os resultados
print(kruskal_test_uf_operacoes)
##
## Kruskal-Wallis rank sum test
##
## data: data_frame_uf_operacoes$RS by data_frame_uf_operacoes$Periodo
## Kruskal-Wallis chi-squared = 26.129, df = 2, p-value = 0.000002119
# Teste de dunn
dunn_test_uf_operacoes <- dunn.test(data_frame_uf_operacoes$RS, data_frame_uf_operacoes$Periodo, method = "holm")
## Kruskal-Wallis rank sum test
##
## data: x and group
## Kruskal-Wallis chi-squared = 26.1295, df = 2, p-value = 0
##
##
## Comparison of x by group
## (Holm)
## Col Mean-|
## Row Mean | Periodo1 Periodo2
## ---------+----------------------
## Periodo2 | 3.901714
## | 0.0001*
## |
## Periodo3 | -0.909137 -4.810851
## | 0.1816 0.0000*
##
## alpha = 0.05
## Reject Ho if p <= alpha/2
# Média dos períodos - estado do Rio Grande do Sul
aggregate(data_frame_uf_operacoes$RS ~ data_frame_uf_operacoes$Periodo, data = data_frame_uf_operacoes, mean)
## data_frame_uf_operacoes$Periodo data_frame_uf_operacoes$RS
## 1 Periodo1 496.4444
## 2 Periodo2 465.0103
## 3 Periodo3 504.5259
# Desvio Padrão dos períodos - estado do Rio Grande do Sul
aggregate(data_frame_uf_operacoes$RS ~ data_frame_uf_operacoes$Periodo, data = data_frame_uf_operacoes, sd)
## data_frame_uf_operacoes$Periodo data_frame_uf_operacoes$RS
## 1 Periodo1 18.26579
## 2 Periodo2 11.24271
## 3 Periodo3 14.22434
# Criação da Matriz de médias por Cartão de Crédito PF
matriz_medias_cartao_de_credito_pf <- matrix(NA, nrow = length(BancoGeral), ncol = 10,
dimnames = list(BancoGeral, NULL))
# Adicionar rótulos às colunas
colnames(matriz_medias_cartao_de_credito_pf) <- c("A vencer 90", "A vencer 91 ate 360", "A vencer 361 ate 1080",
"A vencer 1081 ate 1800", "A Vencer 1801 ate 5400", "A vencer acima 5400",
"Vencido acima 15", "Carteira Ativa", "Inadimplida arrastada", "Ativo problematico")
# Loop for com interações por modalidade Cartão de Crédito - PF #BancoGeral[j]
for (j in 1:length(BancoGeral)) {
End <- paste0("planilha_", BancoGeral[j], ".csv")
planilha <- read_delim(End, delim = ";", escape_double = FALSE, trim_ws = TRUE, show_col_types = FALSE)
# Filtrar as linhas com modalidade igual a "PF - Cartão de Crédito"
Names <- unique(planilha$modalidade)
planilha_filtrada <- filter(planilha, planilha$modalidade == Names[1])
# Convertendo , em .
planilha_filtrada <- planilha_filtrada %>%
mutate_at(vars(14:23), ~ gsub(",", ".", .))
# Convertendo para numérico as colunas a vencer/vencidos e outras relevantes
filtro <- apply(planilha_filtrada[,14:23], 2, as.numeric)
# Teste calculo mean
Mean_filtro <- apply(filtro, 2, mean)
# Armazenar na matriz_medias_cartao_de_credito as médias do filtro
matriz_medias_cartao_de_credito_pf[j,] <- Mean_filtro
}
# Criar objeto ts
matriz_medias_cartao_de_credito_pf_ts <- ts(matriz_medias_cartao_de_credito_pf, start = c(2019, 1), frequency = 12)
# Definir rótulos das linhas
dimnames(matriz_medias_cartao_de_credito_pf_ts)[[1]] <- BancoGeral
# Autoplot
autoplot(matriz_medias_cartao_de_credito_pf_ts)

# Estatística descritiva básica
stat.desc(matriz_medias_cartao_de_credito_pf_ts)
## A vencer 90 A vencer 91 ate 360 A vencer 361 ate 1080
## nbr.val 48.0000000 48.0000000 48.000000
## nbr.null 0.0000000 0.0000000 0.000000
## nbr.na 0.0000000 0.0000000 0.000000
## min 8902862.8521989 3509421.0260852 230448.141375
## max 14489646.5198512 5693534.3001578 560696.992983
## range 5586783.6676523 2184113.2740726 330248.851608
## sum 560552795.6071765 213532631.5549928 20350895.823483
## median 11509664.6487708 4373258.1839946 447028.066192
## mean 11678183.2418162 4448596.4907290 423976.996323
## SE.mean 198272.3829706 88825.7401289 14394.660668
## CI.mean.0.95 398872.5855756 178694.3400794 28958.322048
## var 1886973016743.7026367 378720581253.7916260 9945900276.050253
## std.dev 1373671.3641711 615402.7796929 99729.134540
## coef.var 0.1176271 0.1383364 0.235223
## A vencer 1081 ate 1800 A Vencer 1801 ate 5400 A vencer acima 5400
## nbr.val 48.0000000 48.0000000 48.00000000
## nbr.null 0.0000000 0.0000000 0.00000000
## nbr.na 0.0000000 0.0000000 0.00000000
## min 13544.9335035 4919.4483823 0.06648447
## max 93165.8578916 41307.0990237 16.11733478
## range 79620.9243881 36387.6506414 16.05085030
## sum 2397760.1845634 790382.1028323 59.92451278
## median 56291.1606975 14676.1935612 0.08988635
## mean 49953.3371784 16466.2938090 1.24842735
## SE.mean 3427.3275169 1473.7770133 0.57170801
## CI.mean.0.95 6894.8936195 2964.8569259 1.15012816
## var 563835547.5844648 104256896.8784212 15.68880215
## std.dev 23745.2215737 10210.6266643 3.96090926
## coef.var 0.4753481 0.6200926 3.17271907
## Vencido acima 15 Carteira Ativa
## nbr.val 48.0000000 48.0000000
## nbr.null 0.0000000 0.0000000
## nbr.na 0.0000000 0.0000000
## min 1028331.3926530 1452557834.2150736
## max 2512511.5478168 2338783046.1273885
## range 1484180.1551638 886225211.9123149
## sum 73259622.1679335 87088414736.5493927
## median 1438419.5130054 1728255223.5662026
## mean 1526242.1284986 1814341973.6781125
## SE.mean 58871.0522360 33585498.6020053
## CI.mean.0.95 118433.2808690 67565308.2114684
## var 166358437985.7385559 54143314384574288.0000000
## std.dev 407870.6142709 232687159.9048265
## coef.var 0.2672385 0.1282488
## Inadimplida arrastada Ativo problematico
## nbr.val 48.0000000 48.0000000
## nbr.null 0.0000000 0.0000000
## nbr.na 0.0000000 0.0000000
## min 695643.1445480 1135032.5991186
## max 1876705.3932874 2615310.6161151
## range 1181062.2487393 1480278.0169965
## sum 52637299.3816337 75475750.6574986
## median 1065516.8412173 1463291.8051043
## mean 1096610.4037840 1572411.4720312
## SE.mean 42251.5768495 55705.1854200
## CI.mean.0.95 84999.2089170 112064.3783343
## var 85689395820.7246094 148947248768.6980591
## std.dev 292727.5112126 385936.8455702
## coef.var 0.2669385 0.2454427
# Convertendo para data frame
data_frame_cartao_de_credito_pf <- as.data.frame(matriz_medias_cartao_de_credito_pf)
# Adicionar coluna de período ao data frame
data_frame_cartao_de_credito_pf <- data_frame_cartao_de_credito_pf %>%
mutate(Periodo = rep(c("Periodo1", "Periodo2", "Periodo3"), each = 16))
# Realizar o teste de Kruskal-Wallis por períodos
kruskal_test_cartao_de_credito_pf <- kruskal.test(data_frame_cartao_de_credito_pf$`Carteira Ativa` ~ data_frame_uf_operacoes$Periodo)
# Imprimir os resultados
print(kruskal_test_cartao_de_credito_pf)
##
## Kruskal-Wallis rank sum test
##
## data: data_frame_cartao_de_credito_pf$`Carteira Ativa` by data_frame_uf_operacoes$Periodo
## Kruskal-Wallis chi-squared = 33.004, df = 2, p-value = 0.0000000681
# Teste de dunn
dunn_test_cartao_de_credito_pf <- dunn.test(data_frame_cartao_de_credito_pf$`Carteira Ativa`, data_frame_cartao_de_credito_pf$Periodo, method = "holm")
## Kruskal-Wallis rank sum test
##
## data: x and group
## Kruskal-Wallis chi-squared = 33.0045, df = 2, p-value = 0
##
##
## Comparison of x by group
## (Holm)
## Col Mean-|
## Row Mean | Periodo1 Periodo2
## ---------+----------------------
## Periodo2 | 1.464721
## | 0.0715
## |
## Periodo3 | -4.078490 -5.543212
## | 0.0000* 0.0000*
##
## alpha = 0.05
## Reject Ho if p <= alpha/2
# Média dos períodos - operações de cartão de crédito pf
aggregate(data_frame_cartao_de_credito_pf$`Carteira Ativa` ~ data_frame_cartao_de_credito_pf$Periodo, data = data_frame_cartao_de_credito_pf, mean)
## data_frame_cartao_de_credito_pf$Periodo
## 1 Periodo1
## 2 Periodo2
## 3 Periodo3
## data_frame_cartao_de_credito_pf$`Carteira Ativa`
## 1 1710331780
## 2 1634035888
## 3 2098658253
# Desvio padrão dos períodos - operações de cartão de crédito pf
aggregate(data_frame_cartao_de_credito_pf$`Carteira Ativa` ~ data_frame_cartao_de_credito_pf$Periodo, data = data_frame_cartao_de_credito_pf, sd)
## data_frame_cartao_de_credito_pf$Periodo
## 1 Periodo1
## 2 Periodo2
## 3 Periodo3
## data_frame_cartao_de_credito_pf$`Carteira Ativa`
## 1 87102230
## 2 101472785
## 3 139009949